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摘要 :【 目的 】 建 立 绿豆 象 Callosobruchus chinensis 触角 转录 组 数据 库 , 挖 气 绿 豆 象 的 基因 数据 。【 方 
法 】 采 用 高 通 量 测序 平台 (Ilumina Hiseq) 对 绿豆 象 成 虫 触角 进行 转录 组 测序 、 序 列 组 装 及 生物 信 
息 学 分 析 。[【 结果 】 共 获得 51.10 Gb 的 clean data (NCBI SRA 数据 库 登 录 号 : SRP119884 ) 及 83 535 
条 unigenes, 长 度 在 1 kb 以 上 的 unigenes 有 15 075 条 ,unigenes 的 N50 为 1 492 bp。 使 用 BLAST 软 
件 将 绿豆 象 触角 Unigene 序列 与 公共 数据 库 比 对 , 共 注 释 到 22 148 条 unigenes, 其 中 NR 数据 库 注 
释 的 unigenes 最 多 ,为 18 744 条 ,上 且 与 赤 拟 谷 盗 Tribolium castaneum 的 相似 基因 最 多 , 达 39.57% 。 
通过 CO 数据 库 注 释 , 将 unigenes 功能 分 为 细胞 组 分 分子 功能 与 生物 学 过 程 三 大 类 54 个 分 支 , 其 
中 参与 代谢 进程 以 及 结合 与 催化 活性 的 unigenes 比例 较 大 。KEGG 代谢 途径 分 析 表 明 ,9 084 条 
unigenes 形成 289 条 代谢 通路 ,其 中 核糖 体 代谢 通路 所 含 unigene 最 多 ,为 516 条 。 进 一 步 基 因 注 
释 分 析 筛 选 到 140 个 嗅觉 相关 基因 ,包括 12 个 气味 结合 蛋白 (odorant binding protein，OBP) 基 因 ， 
4 个 化 学 感受 蛋白 (chemosensory protein, CSP) 基 因 , 116 个 气味 受 体 (odorant receptor，Or) 基因 ,1 
个 离子 型 受 体 (ionotropic receptor, IR) 基 因 和 7 个 感觉 神经 元 膜 蛋 白 (sensory neuron membrane 
protein, SNMP) 基 因 , 并 用 FPKM 值 对 基因 表达 量 进行 评估 。【 结 论 】 本 研究 获得 了 绿豆 象 触角 转 
录 组 数据 ,为 进一步 研究 绿豆 象 的 基因 功能 分 析 及 嗅觉 感受 机 制 黄 定 分 子 基 础 。 
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Analysis of the antennal transcriptome and olfaction-related genes of 


Callosobruchus chinensis ( Coleoptera: Bruchuidae) 
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Abstract: [Aim)] This study aims to establish the antennal transcriptome database of the azuki bean 
weevil , Callosobruchus chinensis, and to obtain the genetic data. [ Methods) The antennal transcriptome 
of C. chinensis adults was sequenced using an lllumina HiSeq 4000 platform and subjected to 
bioinformatics analysis. [ Results 】 A total of 51.10 Gb clean data ( NCBI SRA accession no.: 
SRP119884) were obtained, and the clean reads were assembled into 83 535 unigenes with an N50 
length of 1 492 bp and 15 075 unigenes over 1 kb in length. A total of 22 148 unigenes in the antennal 


transcriptome of C. chinensis adults were annotated using BLASTX search against the public databases. 
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Most unigenes (18 744 unigenes) were annotated to NR database, and the unigenes of C. chinensis had 
the highest similarity (39.57% ) with those of Tribolium castaneum. All unigenes were divided into 54 
branches of three categories (cellular components, molecular function and biological processes) using 
Cene Ontology (GO), and a lot of unigenes were annotated to be related to metabolic processes, binding 
activities and cellular processes. In KEGG database, 9 084 unigenes were assigned to 289 known 
metabolic pathways. Among these, most unigenes (516) are involved in metabolic pathways of ribosome. 
By further screening and identification, 140 olfaction-related genes of C. chinensis including 12 odorant 
binding protein (OBP) genes, 4 chemosensory protein ( CSP) genes, 116 odorant receptor ( OR ) genes, 
] ionotropic receptor (IR) gene and 7 sensory neuron membrane protein (SNMP) genes were identified, 
and their expression levels were evaluated based on FPKM value. [Conclusion) This study obtained the 
antennal transcriptome data of C. chinensis. The results provide a foundation for the further study of gene 
functions and molecular mechanisms of olfactory reception of C. chinensis. 


Key words: Callosobruchus chinensis; antennal transcriptome; HiSeq; gene annotation; olfaction-related 


genes 





绿豆 象 Callosobruchus chinensis 是 绿豆 Viena 
radiata、 红 豆 V angulars 、 开 豆 忆 uneuiculata 等 豆 


科 植 物种 子 的 主要 害虫 。 绿 豆 象 的 初 侵 染发 生 在 田 


杰 等 (2017 ) 对 扶桑 绵 粉 内 Phenacoccus solenopsis 肉 
成 虫 转录 组 信息 进行 全 面 探讨 ,结果 有 助 于 进一步 
研究 扶桑 绵 粉 晶 的 基因 功能 及 相关 代谢 途径 。 目 








间 ,成 虫 在 嫩 豆 莱 上 产 卯 ,幼虫 及 化 后 星 入 种 子 内 部 
取 食 ( 孙 和 蓄 等 , 2007) 。 田 间 卯 和 幼虫 也 可 随 种 子 进 
入 粮 库 中 继续 为 害 。 由 于 该 虫 隐蔽 性 强 、 分 布 范围 
广 再 侵 染 能 力 强 ,因此 对 绿豆 .再 豆 等 豆 科 作物 的 产 
量 与 品质 造成 了 严重 的 威胁 ( Mainali et al., 2015 ) 。 
嗅觉 是 昆虫 寄主 选择 求偶、 交配 及 产 卵 等 各 种 
行为 活动 的 基础 ,对 其 种 群生 存 、 繁 衍 有 着 重要 的 作 
用 (Field ei al., 2008; Zhang et al., 2015 ) 。 触 角 是 
昆虫 重要 的 感觉 和 嗅觉 融 官 ,上 面 着 生 有 许多 的 嗅 
觉 感 融 ,不 同 的 感 带 可 识别 不 同 的 气味 物质 进而 调 
控 昆 虫 的 行为 活动 ( 刘 召 和 花 保 祯 , 2010) 。 昆 虫 在 
嗅觉 识别 过 程 中 有 多 种 嗅觉 相关 蛋白 的 参与 ,主要 
是 气味 结合 蛋白 (odorant binding proteins，OBPs ) 、 
气味 受 体 (odorant receptors，ORs) 、 化 学 感受 蛋白 
(chemosensory proteins ，CSPs ) .感觉 神经 元 腊 蛋 白 
( sensory neuron membrane proteins, SNMPs ) 、 离 子 型 
受 体 (ionotropic receptor, IR) 等 ,深入 人 研究 昆虫 的 嗅 
觉 相 关 和 蛋白 是 阐明 昆虫 嗅觉 机 理 的 基础 ( 胡 新 颖 ， 
2013; 王 晓 双 , 2017) 。 近 年 来 ,高 通 量 测序 技术 的 
飞速 发 展 极 大 促进 了 昆虫 基因 组 、 转 录 组 ,特别 是 无 
参考 基因 组 信息 的 昆虫 转录 组 学 方面 的 研究 。Vera 
等 (2008 ) 对 庆 网 峡 蝶 Melitaea cinxia 的 转录 组 进行 
高 通 量 测序 ,是 首 个 采用 从 头 组 装 的 无 参 昆 虫 转录 
组 分 析 ; 贺 华 良 等 (2012 ) 通过 转录 组 测序 鉴定 了 黄 
条 跳 甲 Phyllotreta striolata 的 许多 重要 基因 ,为 在 分 
子 水 平 研究 黄 条 跳 甲 的 防治 策略 商定 了 基础 ; 胡 俊 














































































































前 ,转录 组 分 析 已 成 为 非 模式 昆虫 中 进行 基因 挖掘 、 
功能 鉴定 .遗传 多 样 性 分 析 等 的 一 种 有 效 手 段 ( 张 
棋 麟 和 嘉明 龙 , 2013 ) ,国内 外 许多 学 者 通过 触角 转 
录 组 测序 分 析 鉴 定 了 大 量 与 嗅觉 相关 的 基因 
( Grosse-wilde ef al., 2011; Liu et ol.，2012; 
Bengtsson et al., 2012; Liu et al., 2015; Li et al., 
2015 ; 孟 翔 等 , 2016 ) ,为 深入 研究 嗅觉 相关 基因 功 
能 奠定 基础 。 

据 王 宏 民 等 (2017) 报 道 ,绿豆 象 可 根据 绿豆 豆 
蔷 挥 发 性 气味 物质 准确 找到 绿豆 豆荚 产 卵 并 进行 为 
害 。 那 么 绿豆 象 是 如 何 感 知 寄 主 气味 物质 并 准确 定 
位 寄主 ,在 寻找 寄主 植物 过 程 中 嗅觉 是 如 何 发 挥 作 
用 的 ,目前 还 没有 相关 报道 。 深 入 研究 绿豆 象 的 咱 
觉 系统 有 助 于 阐明 绿豆 象 与 寄主 植物 间 的 化 学 通讯 
机 制 ,而 获得 绿豆 象 大 量 的 嗅觉 相关 基因 是 进行 分 
子 机 制 方面 研究 的 前 提 。 为 此 ,本 研究 拟 采用 高 通 
量 测序 技术 对 绿豆 象 触角 转录 组 进行 测序 ,并 通过 
基因 功能 注释 及 分 析 挖 掘 绿豆 象 的 大 量 噢 觉 相关 基 
,为 进一步 从 分 子 水 平 开 展 绿豆 象 行为 调控 及 防 
治 新 策略 的 研究 黄 定 基础 ,同时 也 丰富 薄 翅 目 昆 虫 
基因 数据 库 。 



















































































1 材料 与 方法 


1.1 供 试 昆 虫 


绿豆 象 为 山西 农业 大 学 昆虫 实验 室 室内 饲养 
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(饲养 条 件 : 温 度 26 + 1% ,相对 湿度 75% ~ 80% ， 
光 周 期 16L: 8D) 20 代 以 上 的 成 虫 。 选 取 活 动能 力 
较 强 的 雌雄 绿豆 象 成 虫 各 100 头 , 切 下 触角 ,迅速 用 
液 氮 冷冻 并 保存 于 -80 低温 冰箱 中 备用 。 
1.2 总 RNA 的 提取 及 质量 检测 

将 供 试 肉 雄 绿豆 象 成 虫 触角 进行 RNA 提取 ,经 
NanoDrop 检测 RNA 纯度 ,Qubi2.0 定量 RNA 浓度 ， 
并 由 Agilent2100 精 检 RNA 的 完整 性 ,以 保证 使 用 
合格 的 样品 进行 转录 组 测序 。 
1.3 cDNA 文库 构建 与 测序 

首先 通过 磁 珠 (Olgo dT) 富 集 供 试 样品 的 
mRNA ,然后 将 其 随机 打 断 ;以 mRNA 为 模板 ,用 六 
碱 基 随机 引物 合成 第 1 条 cDNA 链 , 随后 加 入 
dNTPs .RNaseH 、 绥 冲 液 与 DNA polymerase 工 合成 第 
2 条 cDNA 链 ,并 纯化 双 链 cDNA; 末 端 修复 双 链 
cDNA ,加 和 尾 并 连接 相应 的 测序 接头 ,利用 AMPure 
XP beads 选择 其 片段 大 小 ,最 后 通过 PCR 富 集 得 到 
cDNA 文库 。 先 使 用 Qubit2.0 与 Agilent2100 对 文 
库 的 浓度 和 插入 片段 大 小 进行 检测 ,再 通过 Q-PCR 
准确 定量 文库 的 有 效 浓度 ,以 保证 文库 质量 。 合 格 
的 cDNA 文库 用 Illumina Hiseq 进行 高 通 量 测序 。 
文库 构建 与 测序 均 由 北京 百 迈 客 生物 科技 有 限 公司 
协助 完成 。 
1.4 转录 组 测序 数据 组 装 

对 测序 得 到 的 原始 数据 (raw data) 进行 过 滤 ， 
去 除 接头 序列 以 及 低 质 量 reads ,获得 高 质量 的 数据 
(clean data) ,并 计算 GC 含量 、Q20 (clean data 质量 




















































































































值 大 于 或 等 于 20 的 碱 基 比例 ) 和 Q30( clean data 质 
量 值 大 于 或 等 于 30 的 碱 基 比 例 ) 和 重复 序列 水 平 。 
利用 Trinity 软件 对 clean data 进行 序列 拼接 与 组 
装 ,获得 高 质量 的 绿豆 象 触角 的 unigenes 库 。 为 使 
转录 结果 更 完整 ,本 研究 测序 样品 采用 合并 组 装 的 
方式 (间接 增加 测序 深度 ) ,以 有 利于 后 续 分 析 。 
1.5 转录 组 数据 分 析 

采用 BLAST 软件 将 unigenes 序列 与 NR,，G0， 
COG, KOG 和 eggN0GC4.5 等 数据 库 进行 比 对 ,获得 
unigenes 相应 的 注释 信息 。 
1.6 基因 表达 量 分 析 

采用 Bowtie 将 测序 得 到 的 Read 与 Unigene 库 
进行 比 对 ,根据 比 对 结果 ,结合 RSEM 进行 表达 量 水 
平 评 佑 。 采 用 FPKM (fragments per kilobase of 
transcript per million fragments mapped ) 值 表示 对 应 
unigene 的 表达 丰 度 。 











2 结 


2.1 绿豆 象 触角 转录 组 序列 分 析 与 组 装 

利用 Jumina 测序 平台 对 绿豆 象 触角 转录 组 进 
行 测 序 , 共 获 得 51. 10 Gb 的 clean data (NCBI SRA 
数据 库 登 录 号 : SRP119884, 各 样本 序列 登录 号 
SRS2589197 - SRS2589202 ) ,各 样品 clean data 均 达 
到 7.2 Gb,GC 含量 为 41.49% ~42.43% ,Q20 碱 基 
比例 均 为 100% , Q30 碱 基 比 例 不 少 于 85. 04% 
( 表 1)。 


表 1 绿豆 象 触角 样品 转录 组 数据 评估 统计 


Table 1 Summary for raw reads of cDNA samples of antennae of Callosobruchus chinensis 





样品 编号 * Reads 数 ? 碱 基 总 数 (nt) G+C Q20 Q30 
Samples no. Number of reads Number of bases (%) (%) (%) 
1 24 616 293 7 199 400 096 41.54 100. 00 86.40 
2 27 446 452 8 042 179 414 41.50 100. 00 85.04 
3 32 111 589 9 404 493 446 42. 12 100. 00 85.46 
4 30 956 077 9 081 198 314 41.49 100. 00 85. 66 
5 31 744 803 9 314 790 022 41.53 100. 00 85.93 
6 27 459 060 8 052 995 494 42.43 100. 00 86.19 








a 绿豆 象 触 角 的 测序 样品 编号 Sequencing sample number of antenna of C.chinensis adults; PClean data 中 pair-end reads 总 数 Total number of pair- 
end reads in clean data;“Clean data 总 碱 基数 Total number of bases in clean data.Q20: Clean data 质量 值 大 于 或 等 于 20 的 碱 基 比 例 Proportion of 
the bases whose quality score is greater than or equal to 20; Q30: Clean data 质量 值 大 于 或 等 于 30 的 碱 基 比例 Proportion of the bases whose quality 














score is greater than or equal to 30. 


利用 Trinity 软件 对 获得 的 高 质量 的 reads 进行 
序列 组 装 , 结 果 如 表 2 所 示 。 共 得 到 128 528 条 转 
录 本 ,平均 长 度 为 115 439 bp,N50 长 度 为 2 397 bp。 
对 转录 本 进一步 组 装 分 析 , 共 获 得 83 535 条 























unigenes ,长度 分 布 如 图 1 所 示 ,其 中 长 度 在 1 kb 以 
上 的 unigenes 有 15 075 条 , 占 全 部 unigenes 的 
27.54% ,unigenes 的 N50 为 1 492 bp, 组 装 完整 性 
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表 2 绿豆 象 触角 转录 组 组 装 结果 


Table 2 Summary of assembly for the antennal transcriptome of Callosobruchus chinensis 



































长 度 范围 (bp) 转录 本 Transcript Unigene 
Length range 数量 Number 百分比 Percentage 数量 Number 百分比 Percentage 
200 -300 37 151 28.90 33 820 40.49 
300 -500 25 095 19.52 20 159 24.13 
500 -1 000 23 543 18.32 14 481 17.34 
1 000 -2 000 20 081 15. 62 7 926 9.49 
>2 000 22 658 17.63 7 149 8.56 
总 数 Total number 128 528 83 535 
总 长 度 Total length 148 371 160 63 587 354 
N50 长 度 N50 length 2 397 1 492 
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1 绿豆 象 触角 转录 组 Unigenes 长 度 分 布 


Fig. 1 Length distribution of all assembled unigenes in the antennal transcriptome of Callosobruchus chinensis 


2.2 绿豆 象 触角 转录 组 基因 功能 注释 eggNOG4.5 等 数据 库 比 对 ,最 终 获得 22 148 条 有 注 
使 用 BLAST 软件 (BLAST 参数 EE<107) 将 释 信息 的 unigenes(26.51% ) ,结果 如 表 3 所 示 。 其 
Unigene 序列 与 NR, Swiss-Prot, GO, COG, KOG 和 中 NR 数据 库 注释 的 unigenes 最 多 ,为 18 744 条 ,所 


表 3 绿豆 象 触角 转录 组 组 装 结果 


Table 3 Annotated unigenes in the antennal transcriptome of Callosobruchus chinensis 























数据 库 注释 基因 数量 注释 基因 所 占 比例 (% ) 长 度 范 围 (300 ~1 000 pp) 长 度 >1 000 bp 
Annotated database Number of annotated unigenes Percentage of annotated unigenes 300 bp<Length <1 000 bp Length > 1 000 bp 
COG 6 794 8.13 2 133 3 629 
GO 9 084 10. 87 2 .122 5 128 
KEGG 8 338 9.98 2 498 4 709 
KOG 12 558 15.03 3 673 7 130 
Swiss-Prot 10 325 12.36 2 978 6 298 
eggNOG 15 787 18.90 6 075 6 324 
NR 18 744 22.44 6 146 10 091 


All 22 148 26.51 7 604 10 455 
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占 比 例 22.44% ;COG 数据 库 注释 的 最 少 ,为 6 794 
条 , 仅 占 8. 13% ;eggNOG 数据 库 注释 15 787 条 
(18.90% ); KOG 数据 库 注 释 到 12 558 条 
(15.03% ) ; Swiss-Prot 数据 库 注 释 10 325 条 
(12. 36% ) ;GO 数据 库 注释 9 084 条 (10.87% ) 。 
通过 与 NR 数据 库 比 对 注释 ,绿豆 象 触角 转录 
组 注释 到 其 他 物种 的 基因 序列 共 18 744 条 ,其 中 与 


赤 拟 谷 盗 Tribolium castaneum 的 相似 基因 最 多 ,所 
占 比 例 为 39. 57% ,其 他 依次 为 中 欧 山 松 大 小 吉 
(13.70%)、 驴 豆 是 
Acyrihosiphon pisum(2.18% ) 、 印 度 跳 蚁 Harpegnathos 
saliator(1.65% ) .红火 由 Solenopsis invicia(1.26% ) 
和 柑橘 木 乱 Diaphorina citri(1. 24% ) ,其 他 物种 占 
40.39% (图 2)。 


Dendroctonus ponderosae 


赤 拟 谷 盗 Tribolium castaneum 

中 欧 山 松 大 小 寇 Dendroctonus ponderosae 
a 琶 豆 时 Acyrthosiphon pisum 

0 度 跳 凡 Harpegnathos saltator 

红火 由 So1enopsis invicta 

橘 木 乱 Diapporina citri 

a 其 他 Others 


型 
i SC 


m 
广 

















1.24% 一 一 


1.26% 
1.65% 2 18% 


图 2 NR 数据 库 中 注释 的 绿豆 象 触角 Unigenes 
Fig. 2 Annotated unigenes in antennae of Callosobruchus chinensis in NR database 
文献 出 处 Reference sources: 赤 拟 谷 盗 Tribolium castaneum (Tribolium Genome Sequencing Consortium ，2008 ) ; 中 欧 山 松 大 小 守 Dendroctomus 
ponderosae ( Andersson et al.，2013 ) ; 豌豆 蚜 Acythosiphon pisum (The International Aphid Genomics Consortium, 2010); 印度 跳 蚁 Harpegnathos 





saliator (Bonasio et al., 2010); 红火 蚁 Solenopsis invicta( Wurm et al., 2011); 柑橘 木 乱 Diaphorina citri (Wu et al., 2016). 


基于 G0 数据 库 对 绿豆 象 触角 转录 组 进行 功能 
分 类 统计 (图 3) ,9 084 条 unigenes 共 得 到 49 231 条 
功能 注释 ,分 为 三 大 类 ,参与 生物 学 过 程 的 有 23 170 
条 ,其 中 代谢 过 程 基 因 最 多 (5 850 条 ) ,其 次 是 细胞 
进程 (4 847 条 ) 、 单 一 生物 进程 (3 887 条 ) ,其 余 的 
均 在 2 000 条 以 下 ;参与 细胞 组 分 的 有 14 654 条 ,其 
中 细胞 与 细胞 组 分 的 基因 最 多 , 均 为 3 188 条 ,其 次 
是 细胞 器 (2 301 条 ) 复杂 大 分 子 (1 610 条 ) 、 膜 结 
构 (1 509 条 ) 、 细 胞 器 部 分 (1 080 条 ) 与 膜 结构 部 分 
(1 070 条 ) ,其 余 的 均 低 于 1 000 条 ;参与 分 子 功 能 
的 有 11 407 条 ,其 中 催化 活性 与 结合 活性 的 最 多 ， 
分 别 为 4635 和 4 554 条 ,其 余 的 均 在 700 条 以 下 。 

将 绿豆 象 触角 转录 组 unigenes 在 COG 数据 库 
中 进行 分 析 ,9 084 条 unigenes 共 得 到 8 843 条 功能 
注释 ,分 为 25 类 (图 4)。 其 中 数量 最 多 的 是 R 类 
(具有 一 般 功能 ) ,有 1 697 条 (19. 19% ) ,其 余 依次 
是 类 (参与 翻译 .核糖 体 结构 及 生物 合成 )947 条 
(10. 71%),L 类 (复制 .重组 及 修复 ) 669 条 
(7.57% ) ,0 类 (翻译 后 修饰 .蛋白 转运 及 和 蛋白 伴 
侣 )663 条 (7.50% ) ,C 类 (能 量 生 产 与 转换 )619 条 
(7. 00% ) ,了 上 类 (氨基 酸 运输 与 代谢 ) 608 条 
(6. 88% ) ,其 他 类 别 均 低 于 600 条 。 





结合 KEGG 数据 库 对 绿豆 象 触角 转录 组 的 代 
谢 途 径 进 行 分 析 ,9 084 条 unigenes 归属 于 289 个 通 
路 ,包含 200 个 基因 以 上 的 代谢 通路 有 6 个 :核糖 体 
(516) 、 糖 代谢 (289) 、 氧 化 磷酸 化 (275 ) 内 质 网 蛋 
白 加 工 (252) 、RNA 转运 (213 ) 和 剪接 体 (208 ) ; 包 
含 100 ~200 个 基因 的 代谢 通路 有 12 个 ;其 余 代谢 
通路 所 含 基因 数量 均 低 于 100 条 ( 表 4)。 
2.3 绿豆 象 触角 转录 组 嗅觉 相关 基因 分 析 

绿豆 象 触角 转录 组 中 共 注 释 到 140 个 嗅觉 相关 
基因 ( 表 5) ,包括 12 个 气味 结合 蛋白 (odorant- 
binding protein ，OBP ) 基因 、4 个 化 学 感受 和 蛋白 
(chemosensory protein ，CSP ) 基因 、116 个 嗅觉 受 体 
(odorant receptor，Or ) 基因 、1 个 离子 型 受 体 
(ionotropic receptor, IR) 基因 和 7 个 感觉 神经 元 膜 
蛋白 (sensory neuron membrane protein, SNMP) 
基因 。 

绿豆 象 触角 转录 组 鉴定 的 9 084 条 unigenes 
中 ,表达 量 较 高 (FPKM > 10) 的 基因 6 307 个 ,不 表 
达 (FPKM =0) 的 基因 11 989 个 ( 表 6) 。 表 达 丰 度 
较 高 的 前 50 个 基因 中 (FPKM 值 均 大 于 1700) ,有 6 
个 OBP 基因 , 占 OBP 基因 总 数 的 50% ,其 中 表达 量 
最 高 的 OBP 基因 的 FPKM 为 15 440( 图 5) 。 
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细胞 组 织 部 分 或 生物 合成 Cellular component organization or biogenesis 
生物 调节 Biological regulation 

多 细胞 进程 Multi-organism process 

定位 Localization 

应 激 响 应 Response to stimulus 

节律 进程 Rhythmic process 

生物 相 Biological phase 

单 细胞 有 机 体 进 程 Single-organismprocess 
细胞 活动 Locomotion 

生长 Growth 

发 育 进程 Developmental process 

多 细胞 有 机 体 进程 Multi-organism process 
信号 转 导 Signaling transduction 

生物 附着 Biological adhesion 
繁殖 进程 Reproductive process 

细胞 进程 Cellular process 
代谢 进程 Metabolicprocess 

免疫 系统 进程 Immunesystem process 
细胞 杀伤 Cell killing 

繁殖 Reproduction 

分 子 转 导 活性 Molecular transducer activity 
蛋白 标签 Protein tag 

受 体 调节 活性 Receptor regulator activity 
酶 调节 活性 Enzyme regulator activity 
金属 伴侣 蛋白 活性 Metallochaperone activity 

通道 调节 活性 Channel regulator activity 

抗 氧化 活性 Antioxidant activity 

成 形 素 活性 Morphogen activity 

电子 传递 活性 Flectron carrier activity 

结合 活性 Binding activity 

转运 活性 Transporter activity 

结构 分 子 活性 Structural molecule activity 

鸟 呆 叭 核 车 酸 交换 因子 活性 Guanyl-nucleotide exchange factor activity 
受 体 活性 Receptor activity 

催化 活性 Catalytic activity 

核 苷 酸 结合 转录 因子 活性 Nucleicacid binding transcription factor activity 
结合 重 白 转录 活性 Protein bindingtranscription factor activity 
突 触 Synapse 

细胞 部 分 Cell part 

突 触 部 分 Synapse part 

膜 结 宰 部 分 Membrane part 

细胞 器 部 分 Organelle part 

胞 外 区 部 分 Extracellular region part 

胞 外 基部 分 Extracellular matrix part 

细胞 器 Organelle 
复杂 大 分 子 Macromolecular complex 
膜 关 闭 内 腔 Membrane-enclosed lumen 
胞 外 基部 分 Extracellular matrix 

细胞 连接 Celljunction 

膜 结构 Membrane 

核 状 小 体 Nucleoid 

细胞 Cel 

胶原 三 聚 体 Collagen trimer 


生物 学 过 程 Biological process 






分 子 功 能 Molecular function 
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图 3 绿豆 象 触角 Unigenes GO 功能 注释 


Fig. 3 Annotated unigenes in antennae of Callosobruchus chinensis in GO database 


3 讨论 


随 着 新 一 代 高 通 量 测 序 技术 的 发 展 , RNA-Seq 
技术 已 经 成 为 转录 组 研究 的 重要 手段 ,并 被 成 功 运 





100 


用 于 非 模式 昆虫 的 功能 基因 挖 据 。 绿 豆 象 触角 转录 
组 经 测序 .序列 组 装 与 分 析 , 共 获得 clean data 51. 10 
Gb ,unigenes 83 535 条 ,所 有 样本 的 Q30 碱 基 比例 不 


低 于 85.04% ,N50 为 1 492 bp。 据 报道 ,样本 数据 
的 Q30 碱 基 比 例 不 小 于 80% , 测序 质量 较 好 ; N50 值 


174 昆虫 学 报 Acta Entomologica Sinica 61 卷 





国 A: RNA processing and modification 
8: chromatin structure and dynamics 
图 -: Energy production and conversion 
图 D: Cell cycle control, cell division, chromosome partitioning 
| E: Amino acid transport and metabolism 
F: Nucleotide transport and metabolism 
国 G: Carbohydrate transport and metabolism 
| H: Coenzyme transport and metabolism 
1 Lipid transport and metabolism 
Translation, ribosomal structure and biogenesis 
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L: Replication, recombination and repair 
回 M: Cell wall/membrane/envelope biogenesis 
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图 O: Posttranslational modification, protein turnover, chaperones 


加 P: Inorganic ion transport and metabolism 
500- 加 Q: Secondary metabolites biosynthesis, transport and catabolism 
围 R: General function prediction only 
国 S: Function unknown 
回 T: Signal transduction mechanisms 
图 U: Intracellular trafficking, secretion, and vesicular transport 
转 V: Defense mechanisms 
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4 绿豆 象 触角 Unigenes COG 功能 分 类 


Fig. 4 COG classification of the annotated unigenes in antennae of Callosobruchus chinensis 









































表 4 绿豆 象 触角 转录 组 KEGG 通路 分 析 表 5 绿豆 象 触角 转录 组 嗅觉 相关 基因 
Table 4 KEGG pathways in the antennal transcriptome TableS Olfaction-related genes in the antennal 
of Callosobruchus chinensis transcriptome of Callosobruchus chinensis 
通路 了 D 代谢 通路 基因 数量 嗅觉 相关 基因 注释 的 基因 数量 
Pathway ID Metabolic pathways Number of genes Olfaction-related genes Number of annotated unigenes 

ko03010 ”核糖 体 Ribosome 516 气味 结合 蛋白 基因 仿 
ko01200 “” 糖 代 谢 Carbon metabolism 289 Odorant-binding protein (OBP) genes 
ko00190 氧化 磅 酸化 275 化 学 感受 蛋白 基因 

Oxidative phosphorylation Chemosensory protein (CSP) genes 

网 蛋 i 

内 质 网 重 | 1 加 工 嗅觉 受 体 基因 本 
ko04141 Protein processing in endoplasmic 252 Odorant rocepior CORY yeuss 

reticulum 

离子 型 受 体 基 

ko03013 ”RNA 转运 RNA transport 213 高 于 受 体 基因 1 

a JIonotropic receptor (IR) genes 
ko03040 “剪接 体 Spliceosome 208 
ko01230 ”氨基酸 合成 Biosynthesis of amino acids 191 感觉 神经 元 膜 蛋白 
ko00230 ” 味 叭 代谢 Purine metabolism 176 Sensory neuron membrane protein 7 
ko04145 “ 吞 叭 体 Phagosome 171 (SNMP) genes 
ko00010 ” 糖 醇 解 途径 Glycolysis/Gluconeogenesis 153 
ko04142” 溶 酶 体 Lysosome 150 3 We 

pe 表 6 绿豆 象 触角 转录 组 FPKM 值 统计 

这 系 介 村 且 焦 日 水 屏 
ko04120 2 146 Table6 Summary of FPKM value of the antennal 

Ubiquitin mediated proteolysis 
ko04144 ”内 哈 作 用 Endocytosis 146 transcriptome of Callosobruchus chinensis 
ko04146 ”过 氧化 物 酶 体 Peroxisome 129 FPKM 值 Unigene 数目 (条 ) 
ko00240 “” 喀 啶 代谢 Pyrimidine metabolism 113 FPKM value Number of unigenes 

RNA 监视 途径 

ko03015 人 监视 途径 113 0 11 989 

mRNA surveillance pathway 

二 凑 酸 循环 >1 14 434 
ko00020 一 " 109 >10 6 307 

Citrate cycle (TCA cycle) 
ko03018 ”RNA 降解 RNA degradation 101 FPKM: Fragments per kilobase of transcript per million fragments 





一 其 他 通路 Other pathways <100 mapped. 
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图 5 


绿豆 象 触角 转录 组 中 表达 丰 度 较 高 的 50 个 基因 


Fig. 5 Top 50 most abundant unigenes in the antennal transcriptome of Callosobruchus chinensis 


越 大 序列 拼接 的 完整 性 越 好 ( 王 兴 春 等 , 2015)。 可 
见 本 试验 获得 的 测序 数据 质量 较 好 ,保证 了 转录 组 
分 析 的 准确 性 及 重要 功能 基因 挖掘 的 可 能 性 。 

经 多 个 数据 库 比 对 注释 结果 表明 ,有 22 148 条 
unigenes(26.51% ) 成 功 注 释 。 在 NR 数据 库 中 , 绿 
豆 象 注释 到 赤 拟 谷 次 Tcastaneum 的 序列 信息 最 多 
(Tribolium Cenome Sequencing Consortium, 2008 ) 。 
多 数 昆 虫 转录 组 测序 结果 表明 ,注释 到 的 unigenes 
均 与 基因 组 信息 已 知 且 亲 缘 关 系 较 近 的 物种 相似 性 
序列 最 多 ,如 扶桑 绵 粉 内 P，solenopsis 转录 组 注释 
到 豌豆 蚜 4A. pisum( The International Aphid Cenomics 
Consortium, 2010 ) 的 相似 基因 最 多 ,所 占 比 例 为 
18. 69% (The International Aphid Cenomics Consortium ， 
2010; 胡 俊 杰 等 , 2017) ; 黄粉 虫 Tenebrio molitor 触角 
转录 组 注释 到 赤 拟 谷 盗 的 基因 所 占 比例 为 90. 81% 
(Liu et al., 2015) ; 梨 小 食心虫 Grapholita molesta 触 
角 转 录 组 注释 到 帝王 蝶 Danaus plexippus 的 序列 也 
是 最 多 的 ,为 52.2% (Li et al., 2015)。 绿 豆 象 触角 
转录 组 仍 有 61 387 条 unigenes 没有 得 到 注释 ,这 可 
能 与 序列 片段 长 短 有 关 ( 魏 利 斌 等 , 2012) ,也 可 能 
是 新 的 基因 或 者 是 非 编 码 序 列 ( Konishi and 
Ohnishi, 2006; Hou et al., 2011)。 

G0 数据 库 的 基因 功能 分 类 体系 有 助 于 全 面 认 





识 绿豆 象 的 基因 与 基因 产物 。 绿 豆 象 触角 转录 组 
unigenes 在 GO 数据 库 中 共 得 到 的 49 231 条 功能 注 
释 ,分 别 隶 属于 生物 学 过 程 、 细 胞 组 分 与 分 子 功能 三 
大 类 一 级 功能 注释 ,其 中 参与 代谢 、 细 胞 组 分 、 催 化 
与 结合 活性 的 基因 功能 注释 较 多 ,这 与 许多 昆虫 的 
转录 组 研究 结果 较为 一 致 (Liu et al., 2015; Li et 
al.，2015; 金 永 玲 等 , 2015 ) 。 不 同 昆虫 的 G0 二 级 
功能 注释 情况 有 一 定 差 异 , 如 扶桑 绵 粉 内 二 级 功能 
注释 有 55 个 ( 胡 俊 杰 等 ,2017); 荔 枝 带 蛙 忠 
Conopomorpha sinensis 有 47 个 ( 孟 翔 等 ,2016); 大 
热 尖 埃 蝗 fpacromius coerulipes 有 58 个 ( 金 永 玲 等 ， 
2015 ) ,绿豆 象 触角 转录 组 GO 二 级 功能 注释 有 54 
个 。 绿 豆 象 触角 转录 组 经 KEGG 数据 库 注释 得 到 
289 条 代谢 通路 ,主要 涉及 核糖 体 、 糖 代谢 氧化 磷酸 
化 等 ,其 中 参与 核糖 体 代谢 的 基因 数量 最 多 , 达 516 
条 ,充分 说 明 核 糖 体 蛋 白质 的 合成 在 绿豆 象 嗅觉 行 
为 活动 中 的 重要 性 。 

大 量 嗅 觉 相关 基因 已 经 在 畏 怒 目 部 分 昆虫 中 被 
鉴定 ,包括 模式 生物 赤 拟 谷 盗 与 非 模 式 生 物 中 欧 山 
松 大 小 埠 Dendroctionus ponderosae ( Andersson et al.， 
2013) 、 白 晴 罕 吉本 Agrilus planipennis ( Mamidala et 
al., 2013 ) 、 松 黑 天 和 牛 Monochamus alternatus( Wang et 
al., 2014) 、 黄 粉 甲 (Liu et al., 2015 ) 等 。 本 研究 首 
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次 从 绿豆 象 触角 转录 组 数据 库 中 挖掘 到 140 个 嗅觉 
相关 基因 ,包括 12 个 OBP 基因 ,4 个 CSP 基因 ,116 
个 OR 基因 ,1 个 IR 基 因 和 7 个 SNMP 基因 。OBP 
与 气味 分 子 的 结合 是 昆虫 嗅觉 系统 中 信号 传递 的 第 
一 步 关 键 反应 ( Pelosi and Maida, 1995 ; 胡 颖 颖 等 ， 
2013 ) ,对 于 昆虫 与 外 界 的 信息 通讯 具有 重要 意义 。 
OBP 分 为 性 信息 素 结合 蛋白 (POBP) 与 普通 气味 结 
合 蛋 白 (GOBP) 两 大 类 。 通 过 序列 比 对 及 基因 注释 
发 现 ,绿豆 象 12 个 OBP 基因 中 , 仅 有 1 个 PBP 基 
,其 余 均 为 COBP 基因 ,因此 绿豆 象 在 识别 寄主 植 
物 挥发 物 过 程 中 ,GOBP 可 能 起 主要 作用 。 不 同 昆 
虫 OBP 基因 的 数量 不 同 , 如 黄粉 虫 19 个 、 赤 拟 谷 盗 
49 个 .中 欧 山 松 大 小 窟 31 个 、 松 墨 天 牛 33 个 (Liu et 
al., 2015) 。 与 其 他 鞘翅 目 昆 虫 相 比 ,绿豆 象 触 角 转 
录 组 分 析 获 得 的 OBP 基因 数量 相对 较 少 ,可 能 是 因 
为 OBP 基因 不 仅 存 在 于 触角 ,还 存在 于 绿豆 象 成 虫 
的 其 他 部 位 如 下 显 须 `. 足 性腺 等 ,有 关 OBP 基因 的 
组 织 表 达 特 异性 及 功能 还 将 有 待 于 进一步 分 析 
验证 。 
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